Pomodo Logo IconPomodo Logo Icon
Tanya PomodoSemua Artikel
Semua
entitas

SWE-BENCH LITE

SWE-bench Lite adalah benchmark yang digunakan untuk mengukur kemampuan model AI dalam menyelesaikan tugas debugging perangkat lunak. Ini berisi serangkaian tugas yang dirancang untuk menguji efektivitas model dalam pemrograman.
Studi Microsoft: AI Sulit Pecahkan Bug, Pemrogram Manusia Tetap Penting
TechCrunch
Teknologi
5 bulan lalu
199 dibaca

Studi Microsoft: AI Sulit Pecahkan Bug, Pemrogram Manusia Tetap Penting